The Open Fern Tree of Life:
常に最新の状態を保つ
全シダ植物系統樹に
向けて

ニッタ ジョエル1, Eric Schuettpelz2, Santiago Ramírez-Barahona3, 岩崎 渉1

1: 東大・院・新領域, 2: Smithsonian Institution, 3: Universidad Nacional Autónoma de México https://joelnitta.github.io/bsj_2022 日本植物学会86回大会 1pAH01

系統樹は生物学に
不可欠

“Only with a phylogeny can we begin to understand diversification, regularities in patterns of evolution, or simply suggest individual evolutionary changes within a clade.”

APGより

→ 様々な研究において、最新の系統樹が必要


http://www.mobot.org/MOBOT/research/APweb/

問題

  • DNAシーケンスデータが日々貯まる

  • 「最新」の系統樹を今日構築して発表しても、明日には古く
    なってしまう

  • 自動的に最新の状態を保つ系統樹が望ましい

本研究の目的

シダ植物*を用いて、分類学的に高精度
種数の多い系統樹を自動的に作るシステムを開発

方法

GenBankのデータマイニング:
葉緑体シングルコピー遺伝子


サンガー法

  • 7遺伝子
  • 約5,100種

次世代(全葉緑体)

  • 79遺伝子(サンガー法遺伝子を含む)
  • 約400種

種名の統一

query matched_name resolved_name
Anemia collina Sm. Anemia collina Sm. Anemia collina Raddi
Pteris flava Merr. Pteris flava Merr. Pteris linearis Poir.

… (合計:6,475列)

自動的な種の誤同定の排除

  • all-by-all BLAST (Camacho et al. 2009) をかける

  • クエリー(種)が異なる科と一致した場合、誤同定と
    して排除する

species accession locus query family match family
Abacopteris_gymnopteridifrons JF303974 rbcL Thelypteridaceae Athyriaceae
Angiopteris_evecta AY344778 trnL-trnF Marattiaceae Ophioglossaceae

… (合計:70件)

系統解析:バックボーンツリー

系統解析:全体のツリー

  • MAFFTによってシーケンスをアライン

  • IQ-TREE (Nguyen et al. 2015) を用いてバックボーンツリーを制約にして最尤法によって系統樹を推定する

  • treePL (Smith and O’Meara 2012) によって分岐年代推定を行う

結果

バックボーンが綺麗に
決まった

  • 93%の分岐点が100%支持

  • 議論のあった分岐点も綺麗に決まった

分岐年代の
再評価

  • 化石の校正点51点(今までの倍近く

分岐年代の
再評価

  • 多くの科の分岐年代を約1〜3千万年より古いと推定

  • 被子植物の「影」で進化したわけではない?

https://fernphy.github.io/

  • データのダウンロードや可視化

  • 系統樹の更新

R パッケージ ftolr

https://github.com/fernphy/ftolr

  • 直接Rに系統樹やアラインメントを読 み込む

  • 外群の有無などのオプション

library(ftolr)
ft_tree(drop_og = TRUE)

Phylogenetic tree with 5582 tips and 5581 internal nodes.

Tip labels:
  Acrostichum_danaeifolium, Acrostichum_speciosum, Acrostichum_aureum, Ceratopteris_richardii, Ceratopteris_cornuta, Ceratopteris_shingii, ...
Node labels:
  100/100, 100/100, 100, 100/100, 100, 100/100, ...

Rooted; includes branch lengths.

常に更新、改善

  • v1.1.0(現在)
    • 専門家と相談して、ヒメシダ科を大幅に改善
  • v1.2.0(構築中)
    • 40点の全葉緑体サンプルを加える
    • バックボーンツリーをより正確に

まとめ

自動化とカスタマイズのバランスを取れた「ちょうど良い」アプローチ

  • GenBankデータを自動的にダウンロードし、系統樹に
    する

  • シダ植物専用の分類システムを導入

  • 他の研究者が簡単に使える

  • 他の生物でも同様にできる?

今後の予定・目標

  • FTOLを完成させる

    • 植物標本庫に収まっている標本のゲノムスキミング
  • 将来的にファイロゲノミクスに切り替える

謝辞

  • 日本学術振興会

  • Smithsonian National Museum of Natural History Peter Buck Fellowship

  • 東京大学大学院新領域創成科学研究科先端生命科学専攻岩崎研のメンバー

  • A.E. White

  • S. Fawcett

  • M. Hassler

全体のまとめ

  • 自動化とカスタマイズのバランスを取れた「ちょうど良い」アプローチ

  • https://fernphy.github.io/にて常に更新、公開

  • 他の生物でも同様にできる

  • これからはFTOLを完成させることを目指す

References

Benton, M. J., P. Wilf, and H. Sauquet. 2022. The Angiosperm terrestrial revolution and the origins of modern biodiversity. New Phytologist 233:2017–2035.
Camacho, C., G. Coulouris, V. Avagyan, N. Ma, J. Papadopoulos, K. Bealer, and T. Madden. 2009. BLAST+: architecture and applications. BMC Bioinformatics 10:421.
Hassler, M. 2022. World Ferns. Synonymic Checklist and Distribution of Ferns and Lycophytes of the World. www.worldplants.de/ferns/.
Katoh, K., K. Misawa, K. Kuma, and T. Miyata. 2002. MAFFT: A novel method for rapid multiple sequence alignment based on fast Fourier transform. Nucleic Acids Research 30:3059–3066.
Nguyen, L.-T., H. A. Schmidt, A. von Haeseler, and B. Q. Minh. 2015. IQ-TREE: A fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies. Molecular Biology and Evolution 32:268–274.
Rothfels, C. J., F.-W. Li, E. M. Sigel, L. Huiet, A. Larsson, D. O. Burge, M. Ruhsam, M. Deyholos, D. E. Soltis, C. N. Stewart, S. W. Shaw, L. Pokorny, T. Chen, C. DePamphilis, L. DeGironimo, L. Chen, X. Wei, X. Sun, P. Korall, D. W. Stevenson, S. W. Graham, G. K.-S. Wong, and K. M. Pryer. 2015. The evolutionary history of ferns inferred from 25 low-copy nuclear genes. American Journal of Botany 102:1–19.
Schuettpelz, E., and K. M. Pryer. 2009. Evidence for a Cenozoic radiation of ferns in an angiosperm-dominated canopy. Proceedings of the National Academy of Sciences of the United States of America 106:11200–11205.
Smith, S. A., and B. C. O’Meara. 2012. treePL: divergence time estimation using penalized likelihood for large phylogenies. Bioinformatics 28:2689–2690.
Testo, W., and M. Sundue. 2016. A 4000-species dataset provides new insight into the evolution of ferns. Molecular Phylogenetics and Evolution 105:200–211.